년 3월 AI 및 로봇 연구 동향
1. 서론: 2018년, AI 연구의 변곡점
2018년은 인공지능(AI) 기술이 학문적 탐구의 영역을 넘어 사회 전반에 실질적인 영향을 미치기 시작한 중요한 전환기로 기록된다. 이 시기, 대한민국 정부는 서비스 로봇 산업을 차세대 성장 동력으로 지목하고, 2018년까지 핵심 기술 격차를 해소하여 세계 3대 로봇 강국으로 도약하겠다는 야심 찬 발전 전략을 발표했다.1 서비스 로봇 시장은 2018년 33억 7,650만 달러 규모에서 연평균 28.94%의 폭발적인 성장을 기록할 것으로 전망되었으며, 이는 기술의 상업적, 사회적 활용에 대한 기대가 최고조에 달했음을 방증한다.2
이러한 거시적 배경 속에서 2018년 3월에 발표된 주요 연구들은 기술적 성능 향상이라는 전통적인 목표를 넘어서는 새로운 지평을 열었다. AI 시스템의 공정성, 투명성, 책임에 대한 근본적인 질문이 제기되었고, 예측 불가능한 실제 환경에 대한 로봇의 적응 능력을 획기적으로 개선하려는 시도가 이루어졌으며, 인간 사회 속에서 로봇이 수행해야 할 바람직한 역할에 대한 깊이 있는 성찰이 시작되었다. 이 시기의 연구들은 단순히 개별적인 기술적 성취에 머무르지 않고, AI 기술 개발의 패러다임 자체에 대한 중요한 질문을 던졌다는 점에서 학문적 변곡점을 형성한다.
본 보고서는 2018년 3월을 대표하는 세 가지 핵심 연구 흐름을 중심으로 당시의 학문적 성과를 심층적으로 분석하고자 한다. 첫째, 책임감 있는 AI의 초석을 다진 ‘데이터셋 투명성’ 확보 노력을 통해 AI 개발의 윤리적, 절차적 표준을 탐구한다. 둘째, 실세계의 동적 환경에 대한 적응 능력을 획기적으로 개선한 ’메타 강화학습’의 발전을 통해 AI의 자율성과 강건성(robustness)이 어떻게 진일보했는지 분석한다. 마지막으로, ’사회적 선(Social Good)’이라는 가치를 중심으로 로봇의 역할을 재정의한 ‘인간-로봇 상호작용(HRI)’ 연구를 통해 기술이 인간 사회와 맺어야 할 관계에 대한 통찰을 제공한다. 이 세 가지 축을 통해, 본 보고서는 2018년 3월이 AI 기술의 역량 강화와 사회적 책임에 대한 인식이 동시에 심화된 결정적 시기였음을 논증할 것이다.
2. 책임감 있는 AI의 초석: 공정성과 투명성을 향한 탐구
2018년 3월, AI 연구 커뮤니티는 알고리즘의 성능을 극한으로 끌어올리는 경쟁 너머의 근본적인 문제에 직면하기 시작했다. AI 시스템이 학습하는 데이터에 내재된 편향이 사회적 차별을 증폭시킬 수 있다는 우려가 커지면서, 기술의 공정성과 투명성을 확보하기 위한 노력이 본격화되었다. 이 시기에 발표된 팀닛 게브루(Timnit Gebru) 등의 논문 “Datasheets for Datasets“는 이러한 흐름에 결정적인 방향을 제시하며, AI 연구 개발 문화의 패러다임 전환을 촉발했다.
2.1 문제의 제기: 문서화되지 않은 데이터셋의 위험성
머신러닝 모델의 성능과 행동은 전적으로 학습에 사용된 데이터에 의해 결정된다.3 그럼에도 불구하고, 2018년 이전까지 학계와 산업계에는 데이터셋의 제작 동기, 구성 요소, 수집 과정, 잠재적 한계 및 편향 등을 체계적으로 문서화하는 표준화된 절차가 존재하지 않았다.3 이러한 정보의 부재는 특히 고용, 대출 심사, 의료 진단, 형사 사법과 같이 인간의 삶에 중대한 영향을 미치는 고위험(high-stakes) 분야에서 심각한 문제를 야기할 잠재력을 안고 있었다.3
예를 들어, 특정 인구 집단이 과소 대표된 데이터셋으로 학습된 안면 인식 모델은 해당 집단에 대해 현저히 낮은 정확도를 보일 수 있으며, 과거의 차별적 관행이 반영된 데이터를 학습한 채용 심사 모델은 특정 성별이나 인종에 대한 편견을 영속화하거나 증폭시킬 수 있다.3 이처럼 문서화되지 않은 데이터셋은 마치 회로에서 결함 있는 부품처럼 시스템 전체에 예측 불가능한 오류를 전파하며, 그 원인을 추적하고 해결하는 것을 극도로 어렵게 만든다.3
2.2 새로운 표준의 제안: “Datasheets for Datasets” (arXiv:1803.09010)
이러한 문제의식 속에서 팀닛 게브루와 동료 연구자들은 2018년 3월 23일, arXiv에 “Datasheets for Datasets“라는 제목의 논문을 제출하며 획기적인 해법을 제안했다.5
2.2.1 핵심 아이디어
연구팀은 전자 산업에서 아무리 작은 부품이라도 그 작동 특성, 테스트 결과, 권장 용도 등을 상세히 기술한 ’데이터시트(datasheet)’가 첨부되는 표준 관행에서 영감을 얻었다.3 이와 유사하게, 모든 데이터셋에도 그 생성 배경, 구성 내용, 수집 과정, 의도된 용도 등을 명시한 데이터시트를 첨부할 것을 제안한 것이다.
2.2.2 목표
이 제안의 궁극적인 목표는 AI 커뮤니티 전반의 투명성(transparency)과 책무성(accountability)을 제고하는 것이었다.5 이를 위해 두 핵심 이해관계자 그룹의 필요를 충족시키고자 했다.7
-
데이터셋 제작자(Creators): 데이터시트 작성 과정을 통해 데이터셋 생성, 배포, 유지보수 전반에 걸친 가정, 잠재적 위험, 사회적 영향 등을 신중하게 성찰하도록 유도한다.
-
데이터셋 사용자(Consumers): 데이터셋을 사용하기에 앞서, 해당 데이터셋이 자신의 목적에 적합한지, 어떤 한계를 가지고 있는지 충분한 정보에 기반하여(informed) 의사결정을 내릴 수 있도록 지원한다.
결과적으로 데이터시트는 제작자와 사용자 간의 명확하고 구조화된 소통 채널을 제공함으로써, 데이터셋의 오용을 방지하고 머신러닝 연구 결과의 재현성을 높이는 데 기여할 수 있다.7
2.3 데이터시트의 구성 요소: 성찰을 유도하는 질문들
“Datasheets for Datasets“에서 제안된 데이터시트는 단순히 정보를 나열하는 체크리스트가 아니다. 이는 제작자의 깊은 성찰을 유도하기 위해 고안된 일련의 질문들로 구성되어 있으며, 자동화된 문서 생성을 지양한다.7 논문에서 제시된 주요 질문 범주는 데이터셋 생명주기의 핵심 단계를 반영하여 다음과 같이 구성된다.7
-
동기 (Motivation): 이 데이터셋은 어떤 목적을 위해, 누구에 의해 만들어졌는가? 제작 자금은 누가 지원했는가? 데이터셋이 해결하고자 하는 구체적인 과업은 무엇인가?
-
구성 (Composition): 데이터셋의 각 인스턴스(instance)는 무엇을 나타내는가 (예: 이미지, 문서, 사람)? 총 몇 개의 인스턴스가 포함되어 있는가? 데이터셋이 특정 집단에 대한 민감한 정보를 포함하고 있는가?
-
수집 과정 (Collection Process): 데이터는 어떤 방식으로, 어떤 기간에 걸쳐, 어디서 수집되었는가? 데이터 수집에 참여한 인원은 누구이며, 이들에게는 어떤 지침이 제공되었는가? 데이터 제공자(사람인 경우)로부터 적절한 동의(consent)를 얻었는가?
-
전처리/정제/레이블링 (Preprocessing/Cleaning/Labeling): 수집된 원본 데이터에 어떤 전처리, 정제, 또는 레이블링 과정이 적용되었는가? 이 과정에서 데이터가 어떻게 변형되었으며, 원본(raw) 데이터는 별도로 보존되었는가?
-
용도 (Uses): 이 데이터셋이 사용되기를 권장하는 분야는 무엇인가? 반대로, 기술적 또는 윤리적 문제로 인해 사용되어서는 안 되는 분야는 무엇인가? 이미 이 데이터셋을 활용한 연구나 애플리케이션이 있는가?
-
배포 (Distribution): 데이터셋은 어떤 라이선스 하에, 어떤 경로로 배포될 것인가? 접근에 제한이 있는가?
-
유지보수 (Maintenance): 데이터셋을 호스팅하고 관리하는 주체는 누구인가? 데이터셋의 오류를 수정하거나 업데이트할 계획이 있는가?
이러한 질문들은 데이터셋 제작 과정에 숨어있을 수 있는 무의식적인 가정과 잠재적 편향을 수면 위로 끌어올려, 보다 책임감 있는 데이터 생태계를 구축하는 데 기여한다.
2.4 학문적 의의와 장기적 영향
“Datasheets for Datasets“는 발표 직후 AI 커뮤니티에 큰 반향을 일으켰으며, 그 영향력은 현재까지도 지속되고 있다. 이 논문의 가장 중요한 학문적 기여는 AI의 편향과 공정성 문제를 바라보는 관점을 전환시켰다는 데 있다.
과거에는 AI 편향 문제를 주로 알고리즘을 수정하거나 후처리하는 방식으로 해결하려는 기술 중심적 접근이 주를 이루었다. 그러나 이 논문은 문제의 근원이 데이터 생성 단계에 있음을 명확히 하고, 기술적 해결책을 넘어선 문화적, 절차적 해법을 제시했다. 이는 단순히 ’문서화’의 중요성을 강조한 것을 넘어, 데이터셋 제작 행위 자체를 고도의 윤리적, 사회적 성찰이 요구되는 엄밀한 연구 활동으로 격상시킨 것이다. 2018년 3월, AI 분야의 다른 한 축에서는 알고리즘의 성능을 극대화하는 연구가 활발히 진행되고 있었던 것과 대조적으로, 이 연구는 성능 지상주의에서 한 걸음 물러나 AI 기술 개발의 ’과정’과 ’책임’에 대한 근본적인 질문을 던졌다. 이는 AI 연구의 패러다임이 순수한 기술 개발에서 사회적 영향을 고려하는 방향으로 확장되는 중요한 전환점이었음을 시사한다.
이러한 선구적인 제안은 이후 AI 투명성을 높이려는 다양한 후속 연구에 직접적인 영감을 주었다. 구글의 ‘모델 카드(Model Cards for Model Reporting)’, IBM의 ‘AI FactSheets’, ‘데이터 영양 성분표(Data Nutrition Labels)’ 등은 모두 데이터시트의 철학을 계승하고 발전시킨 결과물이다. 나아가 의료 AI 데이터셋을 위한 특화된 프레임워크인 DAIMS(Datasheets for AI and medical datasets)의 개발로 이어지는 등 9, 특정 도메인에 맞춰 그 개념이 확장되며 AI 개발의 표준 관행으로 자리 잡아가고 있다.
2.5 관련 동향: 설명가능 AI(XAI)에 대한 논의
“Datasheets for Datasets“가 데이터의 투명성에 집중했다면, 비슷한 시기에 설명가능 AI(XAI, Explanatory AI) 연구들은 모델의 투명성에 주목했다.6 2018년을 전후하여 딥러닝 모델이 ’블랙박스’와 같다는 비판이 거세지면서, 모델의 예측 결과를 인간이 이해할 수 있는 형태로 설명하려는 노력이 활발해졌다.
이 시기의 XAI 연구들은 해석가능성(Interpretability)과 설명가능성(Explainability)의 개념을 명확히 정의하고, 언제 이러한 설명이 필요하며 어떻게 그 품질을 평가할 것인지에 대한 학문적 담론을 형성하는 데 주력했다.6 데이터의 투명성을 확보하려는 노력과 모델의 작동 방식을 투명하게 하려는 노력은 ’책임감 있는 AI(Responsible AI)’라는 더 큰 틀 안에서 상호 보완적으로 발전했다. 신뢰할 수 있고 공정한 AI 시스템을 구축하기 위해서는 깨끗하고 잘 문서화된 데이터와, 그 결정 과정을 이해할 수 있는 투명한 모델이 모두 필수적이라는 인식이 이 시기를 기점으로 학계 전반에 확산되기 시작했다.
3. 강화학습의 도약: 동적 환경 적응과 효율성 극대화
2018년 3월, AI 연구의 또 다른 축에서는 시뮬레이션 환경에서의 눈부신 성공을 넘어, 예측 불가능하고 끊임없이 변화하는 실제 환경(real-world)에 강화학습(Reinforcement Learning, RL)을 적용하기 위한 핵심적인 돌파구가 마련되고 있었다. 특히 캘리포니아 대학교 버클리(UC Berkeley) 연구팀이 발표한 모델 기반 메타 강화학습(Model-Based Meta-RL)에 관한 연구는 기존 강화학습의 한계였던 샘플 효율성과 환경 적응 능력을 극적으로 개선하며 로봇공학 응용의 새로운 가능성을 열었다.
3.1 실세계 적용의 난제: 샘플 비효율성과 예측 불가능성
기존의 심층 강화학습 알고리즘들은 아타리 게임이나 바둑과 같이 규칙이 명확하고 안정적인 환경에서 초인적인 성능을 달성했지만, 현실 세계에 적용되기에는 두 가지 근본적인 한계를 가지고 있었다.
첫째는 극심한 **샘플 비효율성(sample inefficiency)**이다. 하나의 특정 기술을 습득하기 위해 수백만, 수천만 번의 시행착오, 즉 방대한 양의 데이터(샘플)를 요구했다.11 실제 로봇 시스템을 이용해 이러한 데이터를 수집하는 것은 시간과 비용 측면에서 거의 불가능에 가까웠다.11
둘째는 예측 불가능성에 대한 취약성이다. 대부분의 RL 에이전트는 훈련 중에 경험했던 것과 유사한 환경에서는 뛰어난 성능을 보였지만, 훈련 데이터 분포에서 벗어난(out-of-distribution) 예기치 못한 상황에 직면하면 쉽게 실패했다.11 예를 들어, 잘 걷도록 훈련된 4족 보행 로봇이라도 갑자기 다리 하나가 고장 나거나, 미끄러운 얼음판을 만나거나, 예상치 못한 화물을 싣게 되면 제대로 된 동작을 수행하기 어려웠다.
3.2 핵심 돌파구: “Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning” (arXiv:1803.11347)
이러한 난제를 해결하기 위해 안나 Nagabandi, 첼시 Finn, 세르게이 Levine 등이 포함된 UC 버클리 연구팀은 2018년 3월, “Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning“이라는 논문을 발표했다.13
3.2.1 핵심 아이디어
이 연구의 핵심 아이디어는 ‘학습하는 방법’ 자체를 학습하는 **메타 학습(Meta-Learning)**을 **모델 기반 강화학습(Model-Based RL)**에 접목한 것이다.11 이는 단 하나의 완벽한 ‘글로벌’ 동역학 모델을 학습하려는 기존의 접근 방식에서 벗어나는 패러다임 전환이었다.12 연구팀은 다양한 환경(task)에서의 경험을 바탕으로, 새로운 환경에 마주했을 때 아주 적은 양의 데이터만으로도 신속하게 현재 상황에 맞는 지역적(local) 동역학 모델로 적응할 수 있는 일종의 ‘사전 지식(prior)’ 또는 ’초기값(initialization)’을 학습하는 방법을 제안했다.
3.2.2 작동 방식
이 접근법에 따라, 에이전트는 먼저 다양한 환경(예: 여러 종류의 지면, 각기 다른 부품 고장 상황)에서 수집된 데이터를 이용해 메타 학습을 진행한다. 이 과정을 통해 ‘빠른 적응에 최적화된’ 동역학 모델의 사전 지식을 습득한다. 그 후, 실제 임무(test time)에 투입된 에이전트는 자신이 최근에 경험한 매우 짧은 데이터(예: 과거 M 타임스텝의 상태-행동-다음 상태 전이)만을 사용하여, 이 사전 지식을 현재 상황에 맞게 신속하게 미세 조정(fine-tuning)한다.14 이렇게 적응된 지역적 모델을 바탕으로 미래(예: 향후 K 타임스텝)의 상태 변화를 예측하고, 모델 예측 제어(Model Predictive Control, MPC)와 같은 기법을 통해 최적의 행동을 계획하여 수행한다.
3.3 주요 방법론 및 수식 해설
연구팀은 이러한 아이디어를 구현하기 위해 두 가지 구체적인 알고리즘을 제안했다: 순환신경망(RNN) 구조를 활용한 **ReBAL(Recurrence-based Adaptive Learner)**과, 대표적인 메타 학습 알고리즘인 MAML(Model-Agnostic Meta-Learning)에 기반한 **GrBAL(Gradient-based Adaptive Learner)**이다.11
특히 GrBAL의 메타 최적화 목표는 ’빠른 적응’이라는 개념을 수학적으로 명확하게 정의한다. 메타 학습의 목표는 다음과 같은 손실 함수 \mathcal{L}_{\text{meta}}를 최소화하는 모델의 초기 파라미터 \theta와 업데이트 규칙의 파라미터 \psi를 찾는 것이다.14
\min_{\theta, \psi} \mathbb{E}_{\mathcal{T} \sim \rho(\mathcal{T})} \left[ \mathcal{L} \left(\mathcal{D}_{\text{test}}^{\mathcal{T}}, \theta'\right) \right] \quad \text{s.t.} \quad \theta' = u_{\psi}\left(\mathcal{D}_{\text{train}}^{\mathcal{T}}, \theta\right)
위 수식의 의미는 다음과 같다.
-
다양한 과업(task)의 분포 \rho(\mathcal{T})에서 하나의 과업 \mathcal{T}를 샘플링한다.
-
해당 과업에서 얻은 소량의 훈련 데이터 \mathcal{D}_{\text{train}}^{\mathcal{T}}(예: 최근 M개의 경험)를 이용해, 업데이트 함수 u_{\psi}를 통해 현재 모델 파라미터 \theta를 새로운 파라미터 \theta'로 한 번 또는 여러 번 업데이트(적응)한다.
-
이렇게 적응된 모델 \theta'의 성능을 해당 과업의 테스트 데이터
DtestT(예: 미래 K개의 경험)에 대해 평가한다 (LT). -
이 테스트 손실을 최소화하는 방향으로 초기 파라미터 \theta와 업데이트 규칙 \psi를 최적화한다.
본질적으로 이 과정은 ’적응 후의 성능’을 극대화하도록 ’적응 전의 초기값’을 학습하는 것으로, ‘빠른 학습 능력’ 자체를 최적화의 목표로 삼는 메타 학습의 정수를 보여준다.
표 1. GrBAL과 ReBAL 방법론 비교
두 알고리즘은 동일한 목표를 추구하지만, 그 구현 방식에서 뚜렷한 차이를 보인다.
| 특징 | Gradient-based Adaptive Learner (GrBAL) | Recurrence-based Adaptive Learner (ReBAL) |
|---|---|---|
| 핵심 원리 | MAML 기반. ‘빠른 적응에 용이한’ 모델 초기값 \theta를 학습. | RNN/LSTM 기반. 최근 경험을 내부 상태(hidden state)에 누적하여 동적으로 모델을 변화시킴. |
| 적응 방식 | 최근 데이터에 대한 손실 함수의 그래디언트를 계산하여 \theta를 명시적으로 업데이트. | 최근 데이터를 RNN에 입력으로 제공하여 내부 상태를 업데이트. 별도의 그래디언트 계산 불필요. |
| 장점 | 업데이트 과정이 명시적이고 해석이 용이함. | 연속적인 데이터 스트림 처리에 자연스러우며, 계산적으로 더 효율적일 수 있음. |
| 단점 | 적응 단계에서 그래디언트 계산이 필요하여 계산 비용이 높을 수 있음. | RNN의 장기 의존성 문제에 영향을 받을 수 있으며, 내부 상태의 해석이 어려움. |
3.4 기술적 기여 및 의의
이 연구의 가장 심오한 기여는 단순히 새로운 알고리즘을 제안한 것을 넘어, 강화학습이 다루는 ’과업(Task)’의 개념을 근본적으로 재정의하고 확장했다는 점에 있다.
기존의 메타 RL 연구들은 주로 보상 함수가 다르거나 환경의 일부 파라미터가 명확히 구분되는 ‘에피소드(episode)’ 단위로 과업을 정의했다. 하지만 이 연구는 **“모든 타임스텝이 잠재적으로 새로운 과업일 수 있다(each timestep to potentially be a new ‘task’)”**는 혁신적인 관점을 제시했다.14 이러한 관점의 전환은 강화학습이 해결해야 할 문제의 범위를 극적으로 확장시켰다. 로봇이 평지를 걷다가 갑자기 경사로를 만나는 순간, 모터 하나가 고장 나는 순간, 지면의 마찰 계수가 변하는 순간 등, 동적으로 발생하는 모든 예측 불가능한 변화를 ’새로운 과업’으로 간주하고 이에 즉각적으로 적응하는 능력을 학습하게 한 것이다. 이는 정적이고 구조화된 시뮬레이션 문제를 푸는 수준을 넘어, 동적이고 비정형적인 실세계 문제에 강화학습을 적용할 수 있는 실질적인 길을 열었다.
실제로 이 연구는 메타 강화학습 알고리즘이 실제 로봇 시스템(a real dynamic legged millirobot)에 성공적으로 적용된 최초의 사례 중 하나로 기록되었으며, 다리 하나가 없는 상태나 새로운 지형에 빠르게 적응하는 능력을 실증적으로 보여주었다.12 이 성과는 이후 로봇공학 분야에서 적응형 제어(adaptive control) 연구에 지대한 영향을 미쳤으며, 후속 연구들은 이 연구의 아이디어를 발전시켜 더욱 정교하고 효율적인 적응 메커니즘을 개발하는 방향으로 나아가고 있다.16
4. 사회 속의 로봇: HRI 2018 컨퍼런스 주요 성과 분석
2018년 3월 5일부터 8일까지 미국 시카고에서 개최된 제13회 ACM/IEEE 국제 인간-로봇 상호작용 컨퍼런스(HRI 2018)는 로봇 기술의 사회적 역할에 대한 심도 있는 논의의 장을 열었다.19 “사회적 선을 위한 로봇(Robots for Social Good)“이라는 대주제 아래, 이 컨퍼런스는 로봇을 단순한 산업용 도구나 기능적 보조 장치를 넘어, 인간의 삶의 질을 향상시키고 복잡한 사회 문제를 해결하는 파트너로서 조망했다.19 HRI 2018에서 발표된 연구들은 아동 교육, 사회적 고립 해소, 대인관계 갈등 중재, 재활 치료 등 다양한 분야에서 로봇의 긍정적 기여 가능성을 탐구하며 당시 HRI 분야의 핵심 담론을 이끌었다.21
4.1 컨퍼런스 개요 및 주제: “Robots for Social Good”
HRI 2018의 주제인 “Robots for Social Good“은 기술의 발전이 궁극적으로 인간 사회에 어떻게 기여해야 하는가에 대한 근본적인 질문을 던졌다. 이는 로봇의 기술적 성능 자체에만 집중하던 관점에서 벗어나, 로봇이 인간의 정서적, 사회적 필요를 어떻게 충족시킬 수 있는지, 그리고 공동체의 긍정적 변화를 어떻게 이끌어낼 수 있는지에 대한 탐구로 연구의 초점을 이동시켰다. 이 컨퍼런스는 로봇이 사회적 행위자(social actor)로서 기능할 때 발생하는 다양한 현상들을 분석하고, 바람직한 상호작용을 설계하기 위한 원칙들을 모색하는 중요한 학술적 플랫폼의 역할을 했다.
4.2 고립을 연결하는 기술: 소셜 네트워킹 로봇 ‘프리보(Fribo)’
HRI 2018에서 최우수 논문 후보(Best Paper Nominee)로 선정된 연구 중 하나인 ’프리보(Fribo)’는 1인 가구 청년층이 겪는 사회적 고립 문제에 대한 독창적인 해법을 제시했다.21
4.2.1 문제 정의 및 독창적 접근
연구팀은 기존 소셜 로봇들이 주로 로봇과 사용자 간의 일대일 상호작용에 집중함으로써 실제 인간 관계망을 활용하지 못하는 한계와, 카메라와 같은 시각 정보를 활용함에 따른 프라이버시 침해 우려에 주목했다.22 이에 대한 대안으로 프리보는 **‘생활 소음(living noise)’**이라는 익명화된 청각 정보를 활용하는 혁신적인 방식을 채택했다.22 프리보는 사용자의 집에 설치되어 현관문이 열리는 소리, 청소기 소리, 웃음소리 등 사적인 대화 내용은 배제된 채 활동 정보만을 담고 있는 소리를 인식한다. 그리고 이 정보를 “친구 A가 방금 집에 돌아왔나 봐!” 또는 “B네 집에서 누군가 청소기를 돌리고 있네“와 같은 메시지로 변환하여, 프리보를 함께 사용하는 가까운 친구 그룹에게 공유한다.
4.2.2 연구 결과 및 의의
4주간 진행된 필드 스터디 결과는 매우 흥미로웠다. 사용자들은 프리보를 통해 친구들의 일상적인 활동을 간접적으로 인지하면서, 마치 친구들과 ‘가상으로 함께 사는(virtual cohabiting)’ 듯한 느낌을 받았다고 보고했다.22 이러한 가상적 연결감은 실제 오프라인에서의 전화나 메시지 교환 등 사회적 상호작용을 유의미하게 증가시키는 촉매 역할을 했다. 동시에, 민감한 시각 정보 대신 익명화된 소리 정보를 활용함으로써 프라이버시 침해에 대한 우려는 현저히 낮았다.23
이 연구는 소셜 로봇의 역할을 재정의하는 중요한 관점을 제시한다. 많은 소셜 로봇이 인간과 직접적인 유대감을 형성하는 ‘친구’ 또는 ‘반려자’ 역할을 지향하는 반면, 프리보는 인간 관계의 ‘매개체(enabler)’ 혹은 **‘촉진자(facilitator)’**로서 기능한다. 로봇이 상호작용의 중심에 서는 대신 한 걸음 물러나 배경에서 사회적 단서(social cue)를 제공함으로써, 사람들 사이의 기존 관계망을 강화하고 새로운 소통의 계기를 마련해주는 것이다. 이는 HRI 디자인에서 로봇의 역할을 보다 섬세하고 간접적인 방향으로 확장할 수 있음을 보여주는 중요한 사례다.
4.3 갈등을 중재하는 로봇: 아동의 대인관계 기술 발달 지원
HRI 2018에서는 로봇이 아동의 사회성 발달에 기여할 수 있는 가능성을 탐구한 연구도 주목받았다. 특히 “Stop. I See a Conflict Happening.“이라는 제목의 연구는 로봇이 유아들의 대인관계 갈등 해결 과정에 긍정적인 영향을 미칠 수 있음을 실험적으로 증명했다.21
4.3.1 연구 질문 및 실험 설계
연구팀은 “소셜 로봇이 아동의 대인관계 갈등 해결 능력의 초기 발달을 지원할 수 있는가?“라는 질문을 탐구하고자 했다.24 이를 위해 3-6세 아동 64명(32쌍)을 대상으로 로봇 ’키폰(Keepon)’과 함께 장난감을 가지고 노는 실험을 설계했다. 아동들은 무작위로 두 조건 중 하나에 배정되었다.25
-
중재 조건(Mediation Condition): 로봇 키폰이 놀이 세션을 진행하다가 아이들 사이에 장난감 소유권을 둘러싼 갈등이 발생하면, “잠깐, 갈등이 생긴 것 같아. 함께 해결해 보자.“라고 말하며 개입했다. 이후 “나는 ~를 원해, 왜냐하면…“과 같이 자신의 생각과 감정을 표현하도록 유도하는 등 건설적인 갈등 해결을 위한 단서를 제공했다.
-
통제 조건(Control Condition): 로봇 키폰이 놀이의 흐름을 안내하기는 했지만, 아이들 간의 갈등 상황에는 전혀 개입하지 않았다.
4.3.2 연구 결과 및 의의
분석 결과, 로봇이 중재한 그룹의 아이들은 통제 그룹에 비해 갈등을 더 건설적으로 해결하는 경향을 보였다.24 특히 이 연구에서 밝혀진 중요한 사실은, 로봇의 가장 핵심적인 역할이 정교한 해결책을 제시하는 것이 아니라, 갈등이 시작되었음을 양측에 **‘인지시키는 것(flagging the onset of a conflict)’**이었다.24 로봇의 개입은 아이들이 감정적인 대립을 잠시 멈추고 문제 해결을 위한 대화의 장으로 들어오게 하는 계기를 마련해주었다. 이 연구는 로봇이 교육적, 치료적 맥락에서 아동의 사회-정서적 학습을 돕는 효과적인 도구가 될 수 있음을 실증적으로 보여주었으며, 이후 로봇을 활용한 갈등 중재 및 사회성 훈련 연구에 중요한 기반을 제공했다.26
4.4 인간과 로봇의 복잡한 관계: 신뢰, 취약성, 그리고 사회적 편견
HRI 2018은 로봇과의 상호작용에서 발생하는 보다 복잡하고 미묘한 사회적 현상에 대한 깊이 있는 탐구가 이루어진 장이기도 했다. 이는 HRI 분야가 기술의 수용성을 넘어, 인간-로봇 관계의 본질을 파고드는 학문적 성숙 단계에 진입했음을 보여준다.
-
취약성과 신뢰: 로봇이 자신의 실수를 인정하거나 도움을 요청하는 등 ‘취약한(vulnerable)’ 행동을 보일 때, 오히려 인간-로봇 팀 내의 신뢰도를 높일 수 있다는 연구 결과가 발표되었다.21 이는 완벽한 기계보다 인간적인 허점을 보이는 로봇에 대해 사람들이 더 긍정적인 사회적 관계를 형성할 수 있음을 시사한다.
-
동조와 진실: 인간이 명백한 정답이 있는 상황에서도 다수의 로봇이 틀린 답을 제시하면, 로봇의 의견에 동조하는 현상을 분석한 연구도 있었다.21 이는 인간이 로봇을 단순한 정보 제공자가 아닌, 사회적 압력을 가하는 주체로 인식할 수 있음을 보여주며 신뢰, 진실, 순응의 복잡한 관계를 탐구했다.
-
로봇과 인종차별: 로봇의 외형(예: 검은색 또는 흰색)에 따라 인간이 인종적 편견을 투영하는 현상을 다룬 “Robots and Racism“이라는 직설적인 제목의 연구는 큰 주목을 받았다.21 이는 로봇이 가치 중립적인 기술이 아니라, 인간 사회의 편견과 고정관념이 투영되고 강화될 수 있는 사회적 거울임을 경고했다.
초기 HRI 연구가 ’어떻게 하면 인간이 로봇을 더 잘 받아들이고 편안하게 사용할까?’라는 수용성 문제에 집중했다면, 2018년 HRI 컨퍼런스의 연구들은 ’인간이 로봇과 상호작용할 때 어떤 복잡한 사회적, 심리적 현상이 발생하는가?’라는 더 깊은 질문으로 나아가고 있었다. 로봇을 향한 인종차별, 로봇에 대한 맹목적 동조, 로봇의 취약성이 신뢰에 미치는 영향 등의 주제는 로봇이 더 이상 단순한 기계가 아니라, 인간의 사회적 인지와 행동을 유발하는 강력한 ’사회적 행위자’로 기능하고 있음을 명확히 보여준다. 이는 1장에서 다룬 ‘책임감 있는 AI’ 담론과 직접적으로 연결된다. 로봇의 디자인과 행동 알고리즘이 사회적 편견을 완화할 수도, 혹은 강화할 수도 있다는 인식은 HRI 분야의 핵심적인 연구 주제로 자리 잡기 시작했으며, 이는 기술 개발에 있어 윤리적, 사회적 성찰이 얼마나 중요한지를 다시 한번 강조한다.
5. AI와 로봇공학의 융합: arXiv 주요 논문 동향
2018년 3월, 학술 논문 사전 공개 플랫폼인 arXiv의 로봇공학(cs.RO) 섹션에는 총 160편의 논문이 등재되었다.13 이 논문들을 전체적으로 조망하면, 인공지능, 특히 머신러닝 기술이 로봇공학의 거의 모든 하위 분야에서 핵심적인 방법론으로 깊숙이 자리 잡았음을 명확히 확인할 수 있다. 이 장에서는 개별 논문 분석을 넘어, 당시 연구 동향의 전체적인 지형도를 분석하여 두 분야의 융합이 어떤 양상으로 이루어지고 있었는지를 살펴본다.
5.1 학습 기반 로봇 제어의 보편화
전통적인 로봇 제어가 정밀한 수학적 모델링에 기반했다면, 2018년 3월의 연구들은 데이터로부터 직접 제어 정책을 학습하는 접근법이 대세가 되었음을 보여준다. 특히 로봇의 이동(locomotion) 및 조작(manipulation) 분야에서 이러한 경향이 두드러졌다.
다수의 논문이 강화학습, 모방학습, 딥러닝 등을 활용하여 복잡하고 동적인 환경에서 로봇이 유연하게 움직이고 정교하게 물체를 다루는 기술을 학습시키는 연구를 다루었다.28 예를 들어, 마이크로 로봇이 다양한 상황에서 재사용 가능한 이동 패턴을 학습하는 연구(arXiv:1803.00196) 28, 인간의 시연으로부터 로봇의 조작 기술을 효과적으로 이전하기 위한 ‘운동학적 모핑 네트워크’ 연구(arXiv:1803.01777) 28, 그리고 2장에서 상세히 다룬 메타 강화학습을 통해 동적 환경에 실시간으로 적응하는 기술(arXiv:1803.11347) 13 등이 대표적이다. 이는 로봇 제어 분야의 패러다임이 ’프로그래밍’에서 ’학습’으로 전환되고 있음을 명확히 보여주는 증거다.
5.2 자율 시스템을 위한 인지 기술의 고도화
자율주행차, 무인 드론 등 자율 시스템의 성공적인 운용은 주변 환경을 정확하게 인지하고 미래를 예측하는 능력에 달려있다. 2018년 3월 arXiv에는 이러한 인지 기술을 고도화하기 위한 연구들이 다수 발표되었다.
컴퓨터 비전(Computer Vision) 기술은 로봇의 ‘눈’ 역할을 하며 핵심적인 기여를 했다. 대규모 객체 추적 데이터셋 및 벤치마크인 ‘TrackingNet’(arXiv:1803.10794) 13은 이 분야의 발전을 가속화하는 중요한 기반을 제공했다. 또한, 카메라와 관성 측정 장치(IMU)의 데이터를 융합하여 변화하는 환경에서도 강건하게 위치를 추정하는 시각-관성 SLAM(Simultaneous Localization and Mapping) 기술(arXiv:1803.01104) 29은 자율 시스템의 안정적인 주행을 위한 핵심 기술로 연구되었다. 나아가, 강화학습을 복잡한 자율주행 시나리오에 직접 적용하려는 시도도 이루어졌는데, 고속도로 램프 구간에서의 안전하고 효율적인 합류 기동을 학습하는 연구(arXiv:1803.09203) 13는 이러한 흐름을 대표한다.
5.3 2018년 3월 arXiv 로봇 분야 주요 연구 분야 요약
2018년 3월 arXiv 로봇공학 섹션에 등재된 160편의 논문들을 종합하면, 당시 로봇 연구의 전체적인 지형도를 파악할 수 있다. 아래 표는 이들 연구를 핵심 주제별로 범주화하고 대표적인 논문들을 정리한 것이다. 이 표를 통해 AI 기술, 특히 학습 기반 접근법이 로봇공학의 다양한 세부 분야에 얼마나 깊숙이 침투하여 혁신을 이끌고 있었는지 한눈에 확인할 수 있다.
표 2. arXiv cs.RO 분야(2018년 3월) 주요 연구 주제 및 대표 논문
| 연구 주제 | 핵심 내용 | 대표 논문 (arXiv ID) |
|---|---|---|
| 이동 (Locomotion) | 강화학습/메타학습을 이용한 보행 및 이동 패턴 생성, 동적 환경 적응 | 1803.00196, 1803.11347 |
| 조작 (Manipulation) | 딥러닝 기반 물체 파지, 기술 이전(skill transfer), 고해상도 촉각 센싱 | 1803.02209, 1803.01777, 1803.00628 |
| 자율주행 및 내비게이션 | 위험 환경에서의 안전 경로 계획, 위상학적 불확실성 하에서의 차선 인식, 강화학습 기반 제어 | 1803.00664, 1803.01378, 1803.09203 |
| 인간-로봇 상호작용 (HRI) | 인간의 경로 예측 및 이를 고려한 경로 계획, 다중 인간 행동 생성 모델링, 인간-로봇 협업을 위한 POMDP 모델 학습 | 1803.00429, 1803.02052, 1803.11300 |
| 컴퓨터 비전 응용 | 대규모 객체 추적 데이터셋(TrackingNet), 내시경 캡슐 로봇을 위한 3D 재구성, 시뮬레이션 및 실제 데이터를 활용한 운동학적 기술 학습 | 1803.10794, 1803.01048, 1803.11147 |
이러한 연구 동향은 로봇공학이 더 이상 기계공학, 전자공학, 제어공학만의 영역이 아니라, AI와 머신러닝이 필수불가결한 핵심 요소로 자리 잡은 융합 학문으로 발전하고 있음을 명백히 보여준다. 데이터로부터 학습하는 능력은 로봇이 과거에는 해결하기 어려웠던 비정형적이고 복잡한 문제들을 해결할 수 있는 새로운 가능성을 열어주었다.
6. 결론: 2018년 3월의 유산과 미래 전망
6.1 연구 성과 종합
2018년 3월은 AI 및 로봇 연구 분야에서 중요한 이중적 발전이 동시에 이루어진 시기로 평가할 수 있다. 한편에서는 메타 강화학습과 같은 혁신적인 기술을 통해 AI의 자율성과 적응 능력을 전례 없는 수준으로 끌어올렸다. 예측 불가능한 실제 환경의 동적인 변화에 실시간으로 대응하는 능력은 로봇이 통제된 실험실을 벗어나 인간의 일상 공간으로 들어올 수 있는 기술적 토대를 마련했다. 다른 한편에서는 “Datasheets for Datasets“와 HRI 2018 컨퍼런스에서 촉발된 논의들을 통해 기술이 사회에 미치는 영향에 대한 깊은 성찰, 즉 기술의 사회적 책임과 윤리에 대한 담론을 본격화했다. AI 시스템의 공정성, 투명성, 그리고 인간 사회와의 바람직한 관계 설정에 대한 고민은 기술 발전의 방향성을 재설정하는 중요한 계기가 되었다.
6.2 핵심 인사이트: 역량 강화와 책임 인식의 동시적 발전
이 두 가지 흐름—기술적 역량의 강화와 사회적 책임에 대한 인식—은 서로 독립적으로 진행된 것이 아니라, 본질적으로 깊이 연결되어 있다. AI의 역량이 강화되고 그 적용 범위가 실세계로 확대될수록, 그에 따른 사회적 영향력과 잠재적 위험 또한 커지기 때문에, 책임 있는 성찰의 필요성은 필연적으로 증대된다.
2장에서 논의된 동적 환경에 적응하는 로봇은 그 자체로 높은 수준의 자율성과 예측 불가능성을 내포한다. 따라서 이러한 로봇을 학습시킨 데이터의 구성과 잠재적 편향을 투명하게 문서화하는 것(1장의 “Datasheets for Datasets”)은 시스템의 신뢰성과 안전성을 확보하기 위한 전제 조건이 된다. 또한, 로봇이 아동의 갈등을 중재하고 사회적 고립을 해소하는 등 인간의 사회적 공간으로 깊숙이 들어올수록(3장의 HRI 연구), 기술의 설계와 적용이 사회적 가치와 규범에 미치는 영향을 신중하게 고려해야 한다는 인식이 확산되었다. 결국 2018년 3월은 AI의 ’역량’과 ’책임’이라는 두 축이 더 이상 분리될 수 없는 하나의 과제임을 인식하고, 이 둘을 함께 논의하기 시작한 의미 있는 출발점이라 할 수 있다.
6.3 미래 전망
이 시기에 제시된 선구적인 아이디어들은 이후 AI 분야의 발전에 지대한 영향을 미쳤다. ’책임감 있는 AI’는 이제 일부 연구자들의 관심사를 넘어, 모든 주요 AI 연구 기관과 기업의 핵심 연구 주제이자 필수적인 개발 원칙으로 자리 잡았다. ’메타 강화학습’은 일반화와 빠른 적응이 중요한 로봇공학, 자율 시스템, 신약 개발 등 다양한 분야에서 표준적인 접근법 중 하나로 채택되어 지속적으로 발전하고 있다. HRI 분야의 사회적, 윤리적 탐구는 로봇이 우리 사회의 단순한 도구가 아닌, 신뢰할 수 있는 구성원으로 자리매김하기 위해 해결해야 할 과제들을 지속적으로 제시하며 기술과 사회의 공진화를 이끌고 있다.
결론적으로, 2018년 3월의 연구들은 단순한 기술적 진보의 나열을 넘어, 오늘날 우리가 마주한 AI 시대의 기술적 토대와 윤리적 화두를 동시에 잉태한 중요한 시기였음을 보여준다. 이 시기에 시작된 역량과 책임에 대한 통합적 고찰은 앞으로 AI 기술이 인류 사회에 더욱 안전하고 유익한 방향으로 발전해 나가는 데 있어 지속적인 길잡이가 될 것이다.
7. 참고 자료
- 정부, 2018년까지 로봇산업 일자리 8만개 창출 - 지디넷코리아, https://zdnet.co.kr/view/?no=20101209164905
- 인공지능(AI) 로봇 시장, https://www.innopolis.or.kr/fileDownload?titleId=177175&fileId=1&fileDownType=C¶mMenuId=MENU00999
- Datasheets for Datasets - Microsoft, https://www.microsoft.com/en-us/research/wp-content/uploads/2019/01/1803.09010.pdf
- Datasheets for Datasets - AI Now Institute, https://ainowinstitute.org/publications/datasheets-for-datasets
- [1803.09010] Datasheets for Datasets - arXiv, https://arxiv.org/abs/1803.09010
- Top 1422 arXiv: Artificial Intelligence papers published in 2018 - SciSpace, https://scispace.com/journals/arxiv-artificial-intelligence-2qlw4xp2/2018
- Datasheets for Datasets - arXiv, https://arxiv.org/pdf/1803.09010
- Datasheets for Datasets - Morgan Klaus Scheuerman, https://www.morgan-klaus.com/readings/datasheets-for-datasets.html
- [2501.14094] Datasheets for AI and medical datasets (DAIMS): a data validation and documentation framework before machine learning analysis in medical research - arXiv, https://arxiv.org/abs/2501.14094
- [1702.08608] Towards A Rigorous Science of Interpretable Machine Learning - arXiv, https://arxiv.org/abs/1702.08608
- Learning to Adapt in Dynamic, Real-World Environments through Meta-Reinforcement Learning | OpenReview, https://openreview.net/forum?id=HyztsoC5Y7
- Learning to Adapt in Dynamic, Real-World Environments through Meta-Reinforcement Learning - ar5iv, https://ar5iv.labs.arxiv.org/html/1803.11347
- Robotics Mar 2018 - arXiv, http://arxiv.org/list/cs.RO/2018-03?skip=150&show=2000
- [2018.03] Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning - AI Caffe, https://kenshinhm.tistory.com/39
- Learning to Adapt in Dynamic, Real-World Environments through Meta-Reinforcement Learning - Semantic Scholar, https://www.semanticscholar.org/paper/Learning-to-Adapt-in-Dynamic%2C-Real-World-through-Nagabandi-Clavera/944bd3b472c8a30163bbfc1b5cbab8545693c3e0
- Disentangled Multi-Context Meta-Learning: Unlocking Robust and Generalized Task Learning - arXiv, https://arxiv.org/html/2509.01297v1
- Toward Task Generalization via Memory Augmentation in Meta-Reinforcement Learning, https://arxiv.org/html/2502.01521v1
- Data-Efficient Task Generalization via Probabilistic Model-based Meta Reinforcement Learning - arXiv, https://arxiv.org/html/2311.07558v2
- HRI 2018 – March 2018 | Chicago, IL, USA - Human-Robot Interaction, http://humanrobotinteraction.org/2018/index.html
- HRI ’18 : Proceedings of the 2018 ACM/IEEE International Conference on Human-Robot Interaction - Háskólinn í Reykjavík - HR - Leitir.is, https://ru.leitir.is/discovery/fulldisplay?docid=alma9916275526706889&context=L&vid=354ILC_HR:06000&lang=is&adaptor=Local%20Search%20Engine
- Proceedings – HRI 2018 - Human-Robot Interaction, https://humanrobotinteraction.org/2018/proceedings/index.html
- Fribo: A Social Networking Robot for Increasing Social Connectedness through Sharing Daily Home Activities from Living Noise Data - Yonsei University, https://yonsei.elsevierpure.com/en/publications/fribo-a-social-networking-robot-for-increasing-social-connectedne
- Fribo: A Social Networking Robot for Increasing Social Connectedness through Sharing Daily Home Activities from Living Noise Data - ResearchGate, https://www.researchgate.net/publication/323590448_Fribo_A_Social_Networking_Robot_for_Increasing_Social_Connectedness_through_Sharing_Daily_Home_Activities_from_Living_Noise_Data
- (PDF) “Stop. I See a Conflict Happening.” A Robot Mediator for Young Children’s Interpersonal Conflict Resolution - ResearchGate, https://www.researchgate.net/publication/323106227_Stop_I_See_a_Conflict_Happening_A_Robot_Mediator_for_Young_Children’s_Interpersonal_Conflict_Resolution
- “Stop. I See a Conflict Happening.” A Robot Mediator for Young Children’s Interpersonal Conflict Resolution - Sisu@UT, https://sisu.ut.ee/wp-content/uploads/sites/233/shen_et_al._2018._a_robot_mediator_for_young_childrens_conflict_resolution.pdf
- What should a robot disclose about me? A study about privacy-appropriate behaviors for social robots - PubMed Central, https://pmc.ncbi.nlm.nih.gov/articles/PMC10757370/
- Publications - Human-Robot Interaction (HRI) Lab, https://hri.cs.uchicago.edu/publications.html
- Robotics Mar 2018 - arXiv, https://arxiv.org/list/cs.RO/2018-03
- Robotics Mar 2018 - arXiv, http://arxiv.org/list/cs.RO/2018-03?skip=0&show=25
- Robotics Mar 2018 - arXiv, http://arxiv.org/list/cs.RO/2018-03?skip=0&show=2000